Cos'è distribuzione gaussiana?

Distribuzione Gaussiana (o Normale)

La distribuzione gaussiana, detta anche distribuzione normale, è una delle distribuzioni di probabilità continue più importanti in statistica. Si caratterizza per la sua forma a campana, simmetrica rispetto alla media.

Caratteristiche principali:

  • Forma a campana: La densità di probabilità della distribuzione gaussiana ha una forma a campana, con il picco centrato sulla media.
  • Simmetria: La distribuzione è simmetrica rispetto alla media (https://it.wikiwhat.page/kavramlar/Media%20(statistica)). Ciò significa che la metà dei dati si trova al di sopra della media e l'altra metà al di sotto.
  • Unimodalità: La distribuzione ha un solo picco (moda), che coincide con la media e la mediana.
  • Definita da due parametri: La distribuzione gaussiana è completamente definita da due parametri:
    • Media (μ): Determina la posizione del picco della campana. Spostando la media, si trasla l'intera distribuzione.
    • Deviazione standard (σ): Determina la larghezza della campana. Una deviazione standard più grande indica una maggiore dispersione dei dati e una campana più ampia. Una deviazione standard minore indica una minore dispersione dei dati e una campana più stretta.

Equazione:

La densità di probabilità (PDF) della distribuzione gaussiana è data da:

f(x) = (1 / (σ * sqrt(2π))) * exp(-((x - μ)^2) / (2 * σ^2))

Dove:

  • x è il valore della variabile casuale
  • μ è la media
  • σ è la deviazione standard
  • π è la costante pi greco (approssimativamente 3.14159)
  • exp è la funzione esponenziale

Distribuzione normale standard:

Un caso particolare della distribuzione gaussiana è la distribuzione normale standard, che ha media μ = 0 e deviazione standard σ = 1. Spesso, si trasformano altre distribuzioni normali in questa per semplificare i calcoli.

Teorema del limite centrale:

Una delle ragioni per cui la distribuzione gaussiana è così importante è il teorema del limite centrale (https://it.wikiwhat.page/kavramlar/Teorema%20del%20limite%20centrale). Questo teorema afferma che la somma (o la media) di un gran numero di variabili casuali indipendenti e identicamente distribuite (anche se le variabili originali non seguono una distribuzione normale) tende a seguire una distribuzione normale al crescere del numero di variabili.

Applicazioni:

La distribuzione gaussiana ha numerose applicazioni in diversi campi, tra cui:

  • Statistica: Stima di parametri, test di ipotesi, analisi di regressione.
  • Fisica: Modellazione di fenomeni casuali come il movimento browniano.
  • Ingegneria: Controllo della qualità, analisi di segnali.
  • Finanza: Modellazione dei prezzi delle azioni.
  • Machine Learning: Algoritmi di classificazione e regressione. Ad esempio, l'algoritmo Naive Bayes assume una distribuzione normale per le caratteristiche.
  • Psicologia: Distribuzione dei punteggi dei test di intelligenza.

Proprietà importanti:

  • Circa il 68% dei dati si trova entro una deviazione standard dalla media (μ ± σ).
  • Circa il 95% dei dati si trova entro due deviazioni standard dalla media (μ ± 2σ).
  • Circa il 99.7% dei dati si trova entro tre deviazioni standard dalla media (μ ± 3σ). Questo è noto come la regola del 68-95-99.7.

Test di normalità:

Esistono diversi test statistici per verificare se un campione di dati segue approssimativamente una distribuzione normale. Alcuni esempi sono il test di Shapiro-Wilk e il test di Kolmogorov-Smirnov. Questi test aiutano a determinare se è appropriato applicare metodi statistici che si basano sull'assunzione di normalità.